Para iniciarmos nossa análise, o primeiro passo é importar os dados do csv para um dada frame.

dadosCEAP = read_csv(here("data/dadosCEAP.csv"))
limiteCEAP = read_csv(here("data/limiteMensalCEAP.csv"))

Dados fornecidos:

  • nomeParlamentar: Nome adotado pelo Parlamentar ao tomar posse do seu mandato.
  • idCadastro: Número que identifica unicamente um deputado federal na CD.
  • sgUF: No contexto da cota CEAP, representa a unidade da federação pela qual o deputado foi eleito e é utilizada para definir o valor da cota a que o deputado tem.
  • sgPartido: Sigla do partido do parlamentar.
  • tipoDespesa: O seu conteúdo é a descrição do Tipo de Despesa relativo à despesa em questão.
  • especDespesa: Representa a descrição especificação mais detalhada de um referido Tipo de Despesa.
  • fornecedor: O conteúdo deste dado representa o nome do fornecedor do produto ou serviço presente no documento fiscal
  • CNPJCPF: O conteúdo deste dado representa o CNPJ ou o CPF do emitente do documento fiscal, quando se tratar do uso da cota em razão do reembolso despesas comprovadas pela emissão de documentos fiscais.
  • tipoDocumento: Este dado representa o tipo de documento do fiscal – 0 (Zero), para Nota Fiscal; 1 (um), para Recibo; e 2, para Despesa no Exterior.
  • dataEmissao: O conteúdo deste dado é a data de emissão do documento fiscal ou a data do documento que tenha dado causa à despesa.
  • valorDocumento: O seu conteúdo é o valor de face do documento fiscal ou o valor do documento que deu causa à despesa. Quando se tratar de bilhete aéreo, esse valor poderá ser negativo, significando que o referido bilhete é um bilhete de compensação, pois compensa um outro bilhete emitido e não utilizado pelo deputado (idem para o dado vlrLiquido abaixo).
  • valorGlosa: O seu conteúdo representa o valor da glosa do documento fiscal que incidirá sobre o Valor do Documento, ou o valor da glosa do documento que deu causa à despesa.
  • valorLiquido: O seu conteúdo representa o valor líquido do documento fiscal ou do documento que deu causa à despesa e será calculado pela diferença entre o Valor do Documento e o Valor da Glosa. É este valor que será debitado da cota do deputado. Caso o débito seja do Tipo Telefonia e o valor seja igual a zero, significa que a despesa foi franqueada.
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE)) 

Perguntas:

  1. Quais são os deputados que gastaram mais dinheiro da CEAP? Quais são os mais econômicos?
  2. Quais os estados cujos deputados gastam mais no exterior? Quais os estados cujos deputados gastam menos no exterior?
  3. Quais os partidos cujos parlamentares mais usam CEAP no estado da Paraíba? Quais são os que menos usam? Mesmas perguntas considerando valores em R$.
  4. Quais os deputados que mais ultrapassam o limite de CEAP do seu estado?
  5. Quais estados cujos parlamentares gastam mais com passagens aéreas?
  6. Escolha três partidos e responda: Quais são os tipos de despesa mais utilizados no uso da CEAP pelos deputados desses partidos? Mesma pergunta considerando valores em R$.
# 1a) Quais são os deputados que gastaram mais dinheiro da CEAP?
dadosCEAP %>% 
  group_by(nomeParlamentar) %>% 
  summarise(valorTot = sum(valorLíquido)) %>%
  filter(valorTot >= 0) %>% 
  arrange(-valorTot) %>% 
  slice(1:10) %>% 
  na.omit(.) %>% 
  ggplot(aes(x = reorder(nomeParlamentar, valorTot),
             y = valorTot,
             fill = valorTot)) +
  geom_col(position = position_identity()) +
  labs(y = "Valor gasto total",
       x = "Nome do candidato",
       title = "Top 10 dos candidatos mais gastosos") +
  coord_flip()

# 1b) Quais são os mais econômicos? 
dadosCEAP %>% 
  group_by(nomeParlamentar) %>% 
  summarise(valorTot = sum(valorLíquido)) %>%
  filter(valorTot >= 0) %>% 
  arrange(valorTot) %>% 
  slice(1:10) %>% 
  na.omit(.) %>% 
  ggplot(aes(x = reorder(nomeParlamentar, -valorTot),
             y = valorTot,
             fill = valorTot)) +
  geom_col(position = position_identity()) +
  labs(y = "Valor gasto total",
       x = "Nome do candidato",
       title = "Top 10 dos candidatos mais econômicos") +
  coord_flip()

# 2  Quais os estados cujos deputados gastam mais no exterior? Quais os estados cujos deputados gastam menos no exterior?
dadosCEAP %>% 
  filter(tipoDocumento == 2) %>% 
  group_by(sgUF) %>% 
  summarise(valorTot = sum(valorLíquido)) %>%
  arrange(-valorTot) %>% 
  na.omit(.) %>% 
  ggplot(aes(x = reorder(sgUF, -valorTot),
             y = valorTot,
             color = sgUF)) +
  geom_point() +
  geom_segment(aes(x = reorder(sgUF, -valorTot),
                   xend = reorder(sgUF, -valorTot),
                   y = 0,
                   yend = valorTot)) +
  labs(x = "UF",
       y = "Valor gasto (R$)",
       title = "Gastos de cada estado no exterior")

# Quais os partidos cujos parlamentares mais usam CEAP no estado da Paraíba? Quais são os que menos usam? Mesmas perguntas considerando valores em R$. 

dadosCEAP %>% 
  filter(sgUF == "PB") %>% 
  group_by(sgPartido) %>% 
  summarise(valorCEAP = sum(valorLíquido),
            countGastos = n()) %>% 
  plot_ly(x = ~sgPartido,
          y = ~countGastos,
          color = ~valorCEAP,
          type = 'bar',
          text = ~paste('Sigla do partido: ', sgPartido,
                        '<br>Quantidade de gastos: ', countGastos,
                        '<br>Valor gasto CEAP: R$', valorCEAP)) %>% 
    layout(title = "Partidos que mais usam o CEAP na PB",
           xaxis = list(title = "Partido"),
           yaxis = list(title = "Quantidade de gastos"))
## Warning: textfont.color doesn't (yet) support data arrays

## Warning: textfont.color doesn't (yet) support data arrays
# Quais os deputados que mais ultrapassam o limite de CEAP do seu estado? 
limitePB <- limiteCEAP %>% 
  filter(UF == "PB")

dadosCEAP %>% 
  filter(sgUF == "PB") %>% 
  group_by(nomeParlamentar) %>% 
  summarise(valorTot = sum(valorLíquido)) %>% 
  filter(valorTot > limitePB$limite_mensal) %>% 
  slice(1:10) %>% 
  na.omit(.) %>% 
  ggplot(aes(x = reorder(nomeParlamentar, -valorTot),
             y = valorTot)) +
  geom_point() +
  coord_flip() +
  labs(title = "Top 10 dos deputados que ultrapassaram o limite de CEAP na PB",
       y = "Valor em R$",
       x = "Nome do deputado")

# Quais estados cujos parlamentares gastam mais com passagens aéreas?

dadosCEAP %>% 
  filter(tipoDespesa == "PASSAGENS AÉREAS") %>% 
  group_by(sgUF) %>% 
  summarise(valorTot = sum(valorLíquido)) %>% 
  na.omit(.) %>% 
  ggplot(aes(x = reorder(sgUF, -valorTot),
             y = valorTot,
             color = sgUF)) +
  geom_point() +
  geom_segment(aes(x = reorder(sgUF, -valorTot),
                   xend = reorder(sgUF, -valorTot),
                   y = 0,
                   yend = valorTot)) +
  coord_flip() +
  labs(x = "UF",
       y = "Valor gasto (R$)",
       title = "Gasto de passagens aéreas por estado com parlamentares")

# Escolha três partidos e responda: Quais são os tipos de despesa mais utilizados no uso da CEAP pelos deputados desses partidos? Mesma pergunta considerando valores em R$.

# Extraindo dados dos partidos escolhidos: PMDB PSDB PT
dadosPMDB <- dadosCEAP %>% 
  filter(sgPartido == "PMDB")

dadosPSDB <- dadosCEAP %>% 
  filter(sgPartido == "PSDB")

dadosPT <- dadosCEAP %>% 
  filter(sgPartido == "PT")
dadosPMDB %>% 
  group_by(tipoDespesa) %>% 
  summarise(valor_total = sum(valorLíquido)) %>% 
  na.omit(.) %>% 
  plot_ly(x = ~valor_total,
          y = ~tipoDespesa,
          type = 'bar',
          color = ~valor_total,
          text = ~paste('Valor total: R$', valor_total,
                        '<br>Tipo de despesa: ', tipoDespesa)) %>% 
  layout(title = "Tipos de despesas: PMDB",
           xaxis = list(title = "Valor total (R$)"),
           yaxis = list(title = "Tipo de despesa"))
## Warning: textfont.color doesn't (yet) support data arrays

## Warning: textfont.color doesn't (yet) support data arrays
dadosPSDB %>% 
  group_by(tipoDespesa) %>% 
  summarise(valor_total = sum(valorLíquido)) %>% 
  na.omit(.) %>% 
  plot_ly(x = ~valor_total,
          y = ~tipoDespesa,
          type = 'bar',
          color = ~valor_total,
          text = ~paste('Valor total: R$', valor_total,
                        '<br>Tipo de despesa: ', tipoDespesa)) %>% 
  layout(title = "Tipos de despesas: PSDB",
           xaxis = list(title = "Valor total (R$)"),
           yaxis = list(title = "Tipo de despesa"))
## Warning: textfont.color doesn't (yet) support data arrays

## Warning: textfont.color doesn't (yet) support data arrays
dadosPT %>% 
  group_by(tipoDespesa) %>% 
  summarise(valor_total = sum(valorLíquido)) %>% 
  na.omit(.) %>% 
  plot_ly(x = ~valor_total,
          y = ~tipoDespesa,
          type = 'bar',
          color = ~valor_total,
          text = ~paste('Valor total: R$', valor_total,
                        '<br>Tipo de despesa: ', tipoDespesa)) %>% 
  layout(title = "Tipos de despesas: PT",
           xaxis = list(title = "Valor total (R$)"),
           yaxis = list(title = "Tipo de despesa"))
## Warning: textfont.color doesn't (yet) support data arrays

## Warning: textfont.color doesn't (yet) support data arrays